智能论文笔记

Mates2Motion: Learning How Mechanical CAD Assemblies Work

James Noeckel , Benjamin T. Jones , Karl Willis , Brian Curless , Adriana Schulz

分类：计算机视觉

2022-08-02

我们描述了我们使用对CAD表示的深度学习来推断机械组件中交配部分之间的自由度的工作。我们使用由CAD零件和配偶将它们组成的大型实际机械组件的大型数据集训练我们的模型。我们提出了重新定义这些伴侣的方法，以使它们更好地反映组件的运动，并缩小可能的运动轴。我们还进行了一项用户研究，以创建具有更可靠标签的运动声音测试集。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Demonstration of machine-learning-enhanced Bayesian quantum state estimation

Sanjaya Lohani , Joseph M. Lukens , Atiyya A. Davis , Amirali Khannejad , Sangita Regmi , Daniel E. Jones , Ryan T. Glasser , Thomas A. Searles , Brian T. Kirby

分类：机器学习

2022-12-15

Machine learning (ML) has found broad applicability in quantum information science in topics as diverse as experimental design, state classification, and even studies on quantum foundations. Here, we experimentally realize an approach for defining custom prior distributions that are automatically tuned using ML for use with Bayesian quantum state estimation methods. Previously, researchers have looked to Bayesian quantum state tomography due to its unique advantages like natural uncertainty quantification, the return of reliable estimates under any measurement condition, and minimal mean-squared error. However, practical challenges related to long computation times and conceptual issues concerning how to incorporate prior knowledge most suitably can overshadow these benefits. Using both simulated and experimental measurement results, we demonstrate that ML-defined prior distributions reduce net convergence times and provide a natural way to incorporate both implicit and explicit information directly into the prior distribution. These results constitute a promising path toward practical implementations of Bayesian quantum state tomography.

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

SPICE, A Dataset of Drug-like Molecules and Peptides for Training Machine Learning Potentials

Peter Eastman , Pavan Kumar Behara , David L. Dotson , Raimondas Galvelis , John E. Herr , Josh T. Horton , Yuezhi Mao , John D. Chodera , Benjamin P. Pritchard , Yuanqing Wang

分类：机器学习

2022-09-21

机器学习潜力是分子模拟的重要工具，但是由于缺乏高质量数据集来训练它们的发展，它们的开发阻碍了它们。我们描述了Spice数据集，这是一种新的量子化学数据集，用于训练与模拟与蛋白质相互作用的药物样的小分子相关的潜在。它包含超过110万个小分子，二聚体，二肽和溶剂化氨基酸的构象。它包括15个元素，带电和未充电的分子以及广泛的共价和非共价相互作用。它提供了在{\ omega} b97m-d3（bj）/def2-tzVPPD理论水平以及其他有用的数量（例如多极矩和键阶）上计算出的力和能量。我们在其上训练一组机器学习潜力，并证明它们可以在化学空间的广泛区域中实现化学精度。它可以作为创建可转移的，准备使用潜在功能用于分子模拟的宝贵资源。

translated by 谷歌翻译

Lower Bounds on the Worst-Case Complexity of Efficient Global Optimization

Wenjie Xu , Yuning Jiang , Emilio T. Maddalena , Colin N. Jones

分类：机器学习

2022-09-20

有效的全球优化是一种广泛使用的方法，用于优化昂贵的黑盒功能，例如调谐参数，设计新材料等。尽管它很受欢迎，但鉴于其广泛使用，较少的关注来分析问题的固有硬度，重要的是要了解有效的全球优化算法的基本限制。在本文中，我们研究了有效的全球优化问题的最严重的复杂性，并且与现有的内核特异性结果相反，我们得出了一个统一的下限，以根据球的度量熵的指标，以实现有效的全局优化的复杂性在相应的繁殖内核希尔伯特空间〜（RKHS）中。具体而言，我们表明，如果存在确定性算法，该算法在$ t $函数评估中实现了任何函数$ f \ in s $ in s $ f \ in $ t $函数评估的次优差距，则有必要至少是$ \ omemega \ left（\ frac {\ log \ mathcal {n}（s（s（\ Mathcal {x}）），4 \ epsilon，\ | \ | \ cdot \ cdot \ | _ \ iftty）} {\ log（\ frac {\ frac {r} {r} {\ epsilon {\ epsilon }）}} \ right）$，其中$ \ mathcal {n}（\ cdot，\ cdot，\ cdot）$是覆盖号码，$ s $是$ 0 $ $ 0 $，RKHS中的RADIUS $ r $，并且$ s（\ mathcal {x}）$是可行套装$ \ mathcal {x} $的$ s $的限制。此外，我们表明，这种下限几乎与常用平方指数核的非自适应搜索算法和具有较大平滑度参数$ \ nu $的垫子\'ern内核所获得的上限匹配，最多可替换为$ $ $ d/2 $ by $ d $和对数项$ \ log \ frac {r} {\ epsilon} $。也就是说，我们的下限对于这些内核几乎是最佳的。

translated by 谷歌翻译

Hybrid Supervised and Reinforcement Learning for the Design and Optimization of Nanophotonic Structures

Christopher Yeung , Benjamin Pham , Zihan Zhang , Katherine T. Fountaine , Aaswath P. Raman

分类：机器学习

2022-09-08

从较高的计算效率到实现新颖和复杂结构的发现，深度学习已成为设计和优化纳米光子电路和组件的有力框架。但是，数据驱动和基于勘探的机器学习策略在其对纳米光逆设计的有效性方面都有局限性。监督的机器学习方法需要大量的培训数据，以产生高性能模型，并且在设计空间的复杂性鉴于训练数据之外，难以推广。另一方面，基于无监督和强化学习的方法可以具有与之相关的非常长的培训或优化时间。在这里，我们证明了一种混合监督的学习和强化学习方法来实现纳米光子结构的逆设计，并证明这种方法可以减少训练数据的依赖性，改善模型预测的普遍性，并通过数量级缩短探索性培训时间。因此，提出的策略解决了许多现代深度学习的挑战，同时为新的设计方法开辟了大门，这些方法利用了多种机器学习算法来为光子设计提供更有效和实用的解决方案。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Do Large Language Models know what humans know?

Sean Trott , Cameron Jones , Tyler Chang , James Michaelov , Benjamin Bergen

分类：自然语言处理 | 人工智能

2022-09-04

人类可以将精神状态归因于他人，即一种称为心理理论的能力。但是，未知这种能力在多大程度上是由先天生物学的捐赠或通过儿童发育所产生的经验而导致的，尤其是在描述他人心理状态的语言中接触。我们通过评估暴露于大量人类语言的模型来检验语言暴露假设的生存能力。在预先注册的分析中，我们向人类参与者和最先进的大语言模型GPT-3提供了错误的信仰任务的语言版本，用于评估思维理论。两者都对他人的信念敏感，但是语言模型的表现不如人类，也没有解释其行为的全部范围，尽管与一生中的人相比，人们受到更多的语言。这表明，尽管语言暴露可能部分解释了人类如何发展思想理论，但其他机制也是造成的。

translated by 谷歌翻译

The Cosmic Graph: Optimal Information Extraction from Large-Scale Structure using Catalogues

T. Lucas Makinen , Tom Charnock , Pablo Lemos , Natalia Porqueres , Alan Heavens , Benjamin D. Wandelt

分类： (统计)机器学习

2022-07-11

我们提出了一种隐含的可能性方法，可以通过分散目录数据量化宇宙学信息，并作为图形组装。为此，我们使用模拟暗物质光环目录探索宇宙学的推断。我们采用最大化神经网络（IMNN）的信息来量化Fisher信息提取，这是图表的函数。我们a）在无噪声限制下，模块图结构对基础宇宙学具有高度敏感性，b）表明，通过比较传统统计，网络自动结合质量和聚类信息，c）证明图形神经网络仍然可以提取信息。当目录受到嘈杂的调查削减时，d）说明了如何将非线性IMNN摘要用作贝叶斯隐性可能性推断的渐近最佳压缩统计。我们在两点相关功能上，我们将$ \ omega_m，\ sigma_8 $参数约束降低了42倍，并证明网络自动组合质量和聚类信息，将关节$ \ omega_m，\ sigma_8 $参数约束减少42倍。。这项工作利用了JAX中的图形数据的新IMNN实现，该实现可以利用数值或自动差异性。我们还显示，IMNNS成功地压缩了远离拟合网络的基准模型的模拟，这表明基于目录的分析中$ n $ point统计的有希望的替代方法。

translated by 谷歌翻译